IPEE : Indice Probabiliste d'Ecart à l'Equilibre pour l'évaluation de la qualité des règles
نویسندگان
چکیده
Résumé. La mesure de la qualité des connaissances est une étape clef d’un processus de découverte de règles d’association. Dans cet article, nous présentons IPEE, un indice de qualité de règle qui a la particularité unique d’associer les deux caractéristiques suivantes : d’une part, il est fondé sur un modèle probabiliste, et d’autre part, il mesure un écart à l’équilibre (incertitude maximum de la conclusion sachant la prémisse vraie).
منابع مشابه
Modèle décisionnel basé sur la qualité des données pour sélectionner les règles d'associations légitimement intéressantes
Résumé. Dans cet article nous proposons d’exploiter des mesures décrivant la qualité des données pour définir la qualité des règles d'associations résultant d’un processus de fouille. Nous proposons un modèle décisionnel probabiliste basé sur le coût de la sélection de règles légitimement, potentiellement intéressantes ou inintéressantes si la qualité des données à l’origine de leur calcul est ...
متن کاملRègles d'association avec une prémisse composée : mesure du gain d'information
La communauté de fouille de données a développé un grand nombre d’indices permettant de mesurer la qualité des règles d’association (RA) selon diverses sémantiques (Guillet, 2004). Cependant ces sémantiques, qui permettent d’interpréter les règles simples, s’avèrent d’utilisation trop complexe pour un expert dans le cas de règles à prémisse composée. Notre objectif est donc de sélectionner les ...
متن کاملMesure formelle de la robustesse des règles d'association
Résumé. Nous proposons dans cet article une définition formelle de la robustesse pour les règles d’association, s’appuyant sur une modélisation que nous avons précédemment définie. Ce concept est à notre avis central dans l’évaluation des règles et n’a à ce jour été que très peu étudié de façon satisfaisante. Il est crucial car malgré une très bonne évaluation par une mesure de qualité, une règ...
متن کاملContrôle du risque multiple pour la sélection de règles d'association significatives
Résumé. Les algorithmes d'extraction de règles d'association parcourent e cacement le treillis des itemsets pour constituer une base de règles admissibles à des seuils de support et de con ance, mais donnent une multitude de règles peu exploitables. Nous suggérons d'épurer de telles bases en éliminant les règles non statistiquement signi catives. La multitude de tests pratiqués conduit mécaniqu...
متن کاملSous-bases k-faibles pour des règles d'association valides au sens de la confiance
L’un des problèmes majeurs rencontrés dans la fouille des règles d’association valides au sens de la confiance est le nombre souvent très élevé de ces règles. Plusieurs solutions à ce problème ont été proposées ou considérées dans la littérature. Parmi ces solutions figurent les bases, c’est-à-dire, des familles génératrices minimales (Zaki et Ogihara, 1998; Pasquier et al., 1999). La plupart d...
متن کامل